Autoévaluation

Question 1

Calculez la factorielle $ n !$ pour $ n=1,2,3,4,5,100$.

Question 2

Calculez $ {n \choose k}$ pour $ n=10$ et $ k=1,2,3,4$.

Calculez $ \sum_{k=1}^4 {n \choose k} k $

Question 3

Vous souhaitez accélérer le calcul des vues du type suivant dans une base de données relationnelles : « SELECT produit, sum(ventes) where country= ? ». Le paramètre « country » peut prendre différentes valeurs.

Vous disposez de 3 Mo de libre pour cette accélération. Comme il y a plus ou moins de produits mis en vente dans différents pays, la taille du résultat de la requête varie selon le pays.

Vous ne savez pas d’avance quels pays risquent d’intéresser l’analyste. Ainsi, vous supposez que tous les pays sont d’un intérêt égal, a priori.

Quelles requêtes devez-vous matérialiser, et pourquoi ?

– Italie (0,4 Mo)
– France (0,5 Mo)
– Canada (0,8 Mo)
– États-Unis (1,4 Mo)
– Sénégal (0,2 Mo)
– Brésil (0,3 Mo)
– Grande-Bretagne (0,4 Mo)
– Allemagne (1,3 Mo)

Question 4

On cherche à estimer la taille de la vue « SELECT produit,pays,sum(ventes) FROM table GROUP BY produit,pays » en nombre de lignes. À cette fin, on extrait un sous-ensemble de la table originale.

En utilisant un modèle statistique multifractal, estimez la taille de la vue.

Échantillon :

produit	pays	fournisseur	ventes
crayon	Canada	Bilboard	432
livre	France	Walmart	4235
vélo	Canada	VendTout	466
livre	Allemagne	VendTout	567
crayon	France	VendTout	887
vélo	Canada	Walmart	421
crayon	Canada	Walmart	14
livre	France	Zellers	566
vélo	Canada	VendTout	67
crayon	Canada	Zellers	89
crayon	Canada	Babo	19

En utilisant les conventions de l’article « Estimation statistique de la taille des vues », nous avons $ p=0.01$ et $ N=1100$ (resp. le ratio d’échantillonnage et le nombre de rangées).

produit	pays
crayon	Canada
livre	France
vélo	Canada
livre	Allemagne
crayon	France
vélo	Canada
crayon	Canada
livre	France
vélo	Canada
crayon	Canada
crayon	Canada

produit	pays
crayon	Canada
crayon	Canada
crayon	Canada
crayon	Canada
vélo	Canada
vélo	Canada
vélo	Canada
livre	France
livre	France
livre	Allemagne
crayon	France

produit	pays	décompte
crayon	Canada	4
vélo	Canada	3
livre	France	2
livre	Allemagne	1
crayon	France	1

Question 5

Nous avons vu dans les articles de cette semaine qu’en prenant le OU exclusif de plusieurs fonctions de hachage (une sur chaque colonne), on composait ainsi une fonction de hachage indépendante trois-à-trois. Est-ce que le même résultat serait vrai avec le OU logique régulier ? Que pouvez-vous dire du ET logique ?

Question 6

Soit la table suivante :

colonne 1	colonne 2
A	Z
A	Y
C	Y
A	Z
C	W
A	W
B	Z

Soit les valeurs hachées suivantes :

A	000
B	110
C	010
W	111
Y	101
Z	011

En utilisant l’algorithme simple de Flajolet et Martin, estimez le nombre de rangées distinctes dans la table. Quelle est la valeur exacte ?

[1] Attention ! Toujours prendre le logarithme en base 2.

[2] La valeur $ {k\choose a}$ est le coefficient binomial.

Semaine 3

RECHERCHE

Autoévaluation

colonne 1	colonne 2	OU exclusif	position bit 1
000	011	011	2
000	101	101	1
010	101	111	1
000	011	011	2
010	111	101	1
000	111	111	1
110	011	101	1